Un algoritmo permetterà a Wikipedia di essere tradotta in tutte le lingue

di redazione 12/06/2017 SCIENZA E TECNOLOGIA
img

Un algoritmo progettato per scansiona Wikipedia in cerca di articoli importanti che non sono ancora stati tradotti in altre lingue. In questo modo, l'enciclopedia online potra' espandersi e dare una maggiore copertura anche alle minoranze linguistiche. Messo a punto nel Politecnico di Losann da Robert West, ricercatore del Data Science Lab.  

Per i redattori di Wikipedia e' difficile capire da dove cominciare il lavoro di traduzione ed e' qui che entra in gioco l'algoritmo, capace di identificare e mette in ordine d'importanza gli articoli per ogni lingua: un compito non semplice, consideramdo che, con 40 milioni di articoli in 293 lingue, Wikipedia è l'enciclopedia più grande mai realizzata. La lingua inglese è senza dubbio la più avvantaggiata, con 5.4 milioni di pagine che coprono una quantità di argomenti 60 volte superiore a quella trattata nell'Enciclopedia Britannica.

Ma non tutti gli idiomi possono disporre di una copertura cosi' ampia: "per esempio, il riscaldamento globale è di interesse cruciale in Madagascar, eppure non c'è neanche un articolo su quest'argomento in malgascio", afferma West. Per aiutare le macchine a capire quanto sia importante un articolo per una determinata lingua è stato necessario calcolare quante visualizzazioni teoriche potrebbe avere.

I ricercatori hanno fatto la stima prendendo in considerazione tutte le lingue e lasciando poi alla macchina il compito di dare ad ognuna il giusto peso. Ad esempio, il giapponese è piu' importante dell'inglese se si tratta di predire l'impatto di una pagina in cinese. Alla fine, la lista di argomenti mancanti appare su una nuova piattaforma, chiamata Wikipedia GapFinder, da dove i redattori completano il lavoro facendo la traduzione.


Tags:




Ti potrebbero interessare

Speciali